Étude de différentes combinaisons de comportements adaptatives
نویسندگان
چکیده
RÉSUMÉ. Cet article s’intéresse à la synthèse automatique d’agents en environnement incertain, se plaçant dans le cadre de l’apprentissage par renforcement, et plus précisément des processus de décision markoviens partiellement observables. Les agents (dénués de modèle de leur environnement et de mémoire à court terme) sont confrontés à de multiples motivations/objectifs simultanés, problématique qui s’inscrit dans le domaine de la sélection d’action. Nous proposons et évaluons différentes architectures de sélection d’action. Elles ont en commun de combiner de manière adaptative des comportements de base déjà connus, en apprenant les réglages de la combinaison afin de maximiser les gains de l’agent. La suite logique de ces travaux est d’automatiser la sélection et la conception des comportements de base eux-mêmes.
منابع مشابه
Poverty Status, Health Behaviours and Health: Implications for Social Assistance and Health Care Policy
Cette étude a examiné les liens entre le statut de pauvreté, les comportements en matière de santé et la santé de 130 Albertains vivant au sein de familles pauvres. Pour les fins de cette étude, le statut de pauvreté indiquait si les familles pauvres recevaient de l’assistance sociale et profitaient de soins de santé complets gratuits ou plutôt si elles travaillaient sans avoir accès à des soin...
متن کاملRésultats actuels d'une étude sérologique de quelques virus de type O apparus au Moyen-orient et en Europe
متن کامل
Etude serologique comparée de différentes souches de virus aphteux de type A isolées au Moyen-Orient et en Europe
متن کامل
Influence du comportement des accompagnants sur le vécu des patients admis pour hémorragies digestives hautes au CHU campus de Lomé (Togo)
Introduction: l'hémorragie digestive haute est une urgence, qui constitue souvent pour les patients un danger mortel suscitant inquiétude et agitation. Dans cet état, le patient dépend de ses accompagnants pour ses soins et pour honorer le traitement ; mais souvent, il a été observé une discordance entre l'urgence et les comportements des accompagnants. Le but de cette étude était de décrire le...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Revue d'Intelligence Artificielle
دوره 20 شماره
صفحات -
تاریخ انتشار 2006